在主要代理模型中,校长向代理商提供了一份合同以执行某项任务。代理商付出了一定的努力,使她的实用性最大化。校长忽略了代理人所选择的努力水平,并且只能根据可能的结果来应对她的工资。在这项工作中,我们考虑了一个模型,其中主体不知道代理商的效用和行动空间:她顺序向相同的代理提供合同,并观察结果的结果。我们提出了一种在温和假设下学习最佳合同的算法。我们约束了本金所需的样本数量,以获取每$ \ eps> 0 $的最佳净利润$ \ eps $以内的合同。即使考虑规避风险的代理,我们的结果也很强。此外,我们表明,当只有两个可能的结果或试剂是风险中性的时,算法的结果近似于经典理论中描述的最佳合同。
translated by 谷歌翻译